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Abstract 



The hardware has a decoupled configuration register and performs programs on a component with a single 
or multi-dimensional cell structure. Data flow or control flow graphs are partitioned into time-separated sub- 
graphs and formed sequentially and implemented on the component. An Independent claim is also included 
for a method for performing programs on a component with a single or multi-dimensional cell structure. 
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(§) Hardware und Betriebsverfahren 

® Die Erfindung betrifft eine ein- oder mehrdimensionale 
Zellstruktur. Hierbei ist eine zeitiich getrennte Sequenzie- 
rung vorgesehen. 
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Beschreibung 

Aufgabe der Erfindung und Anwendungsbereicbe 

5 Die vorliegende Erfindung erstreckt sich auf das Gebiet von programmierbaren und insbesondere wahrend des Betrie- 
bes umprogramniierbaren arithmetischen und/oder logischen Bausteinen mit Vielzahl von arithmetischen und/oder logi- 
schen Einheiten, deren Verschaltung ebenfalls prograrnmierbar und wahrend des Betriebes umprogrammierbar isL Der- 
artige logische Bausieine sind unter dem Oberbegriff FPG A von verschiedenen Firroen verfiigbar. Weiterbin sind meh- 
rerePatente veroffentlicht, die spezielle arilhmetische Bausteine mit automatischerDatensynchronisation und verbesser- 
10 ten oflenlegen. 

Samtliche beschriebene Bausteine besitzen eine zwei- oder mehrdimensionale Anordnung von logischen und/oder 
arithmetischen Einheiten, die uber Bussysteme miteinander verschaltbar sind. 

Aufgabe der Erfindung ist es, ein Programrnierverfahren zur Verfugung zu stellen, das es ermoglicht die beschriebenen 
Bausteine in gewohnbchen Hochsprachen effizient zu programmieren und dabei die Vorteile der durch die Vielzahl von 
15 Einheiten entstehende Parallelitat der beschriebenen Bausteine weitgehend automatisch, vollslandig und effizient zu nut- 
zen. 

Stand der Technik 

20 Bausteine der genannten Gattung werden zumeist unter Verwendung gewohnlicher Datenflussprachen programmiert. 
Dabei treten zwei grundlegende Probleme auf: 

1 . Die Programmierung in Datenflussprachen ist fiir Programmierer gewohnungsbediirftig, tief sequentielle Aufga- 
ben lassen sich nur sehr umstandlich beschreiben. 
25 2. GroBe Applikationen und sequentielle Beschreibungen lassen sich mit den bestehenden Obersetzungsprogram- 
men (Synthese-Tools) nur bedingt auf die gewiinschte Zieltechnologie abbilden (synthetisieren). 

Fur gewohnlich werden Applikationen in mehrere leilapplikationen partitioniert, die dann einzeln auf die Zieltechno- 
logie synthetisiert werden (Fig, 1). Die einzelnen Binarcodes werden dann auf jeweils einen Baustein geladen* Wesent- 
30 liche Voraussetzung der Erfindung ist das in DE 44 16 881 beschriebene Verfahren, das es ermdglicht, mehrere parti tio- 
nierte Teilapplikationen innerhalb eines Bausteines zu nutzen, indem die zeitliche Abhangigkeit analysiert wird und iiber 
Steuersignale sequentiell die jeweils erforderlichen Teilapplikationen bei einer ubergeordneten Ladeeinheit angefordert 
und von dieser daraufhin auf den Baustein geladen werden. 
Existierende Synthese-Tools sind nur bedingt in der Lage Programm-Schleifen auf Bausteine abzubilden (Fig. 2 
35 (0201)). 

Dabei werden sogenannte FOR-Schleifen (0202) als Primitiv-Scbleife haufig noch dadurch unterstiitzt, daB die 
Schleife vollkommen auf die Ressourcen des Zielbausteines ausgewalzt werden. 

WKELE-Schleifen (0203) besitzen im Gegensatz zu FOR-Schleifen keinen konstanten Abbruchswert. \fielmehr wird 
durch eine Bedingung evaluiert, warm der Schleifenabbruch stattfindet Daher ist gewdhnlicherweise (wenn die Bedin- 
40 gung nicht konstant ist) zur Synthesezeit nicht bekannt, wenn die Schleife abbricht Durch das dynamische \%rhalten 
konnen Synthese-Tools diese Schleifen nicht fest auf Hardware abgebildet d. h. auf einen Zielbaustein ubertragen wer- 
den. 

Rekursionen sind grundsatzlich nicht auf Hardware abbildbar, warm die Rekursionstiefe nicht zur Synthesezeit be- 
kannt und damit konstant ist Bei der Rekursion werden mit jeder neuen Rekursionsebene neue Ressourcen allokiert. Das 
45 wiirde bedeuten, daB rrrit jeder Rekursionsebene neue Hardware zur Verfugung gestellt werden muB, was aber dynarnisch 
nicht moglich ist. 

Selbst einfache Grundstrukturen sind von Synthesetools nur dann abbildbar, wenn der Zielbaustein ausreichend groB 
ist, d. h. ausreichende Ressourcen bietet. 

Einfache zeitliche Abhangigkeiten (0301) werden durch heutige Synthese-Tools nicht in mehrere Teilapplikationen 
50 partitioniert und sind deshalb nur als Ganzes auf einen Zielbaustein ubertragbar. 

Bedingte Ausfuhrungen (0302) und Schleifen Ober Bedingungen (0303) sind ebenfalls nur abbildbar, wenn ausrei- 
chende Ressourcen auf dem Zielbaustein existieren. . 

ErfindungsgemaBes Verfahren 

55 

Durch das in DE 44 16 881 beschriebene Verfahren ist es mdglich Bedingungen zur Laufzeit innerhalb der Hardware- 
strukturcn der genannten Bausteine zu erkennen und derart dynarnisch darauf zu reagieren, daB die Funktion der Hard- 
ware entsprechend der eingetretenen Bedingung modifiziert wird, was im wesentlichen durch das Konfigurieren einer 
neuen Struktur geschieht. 

60 Ein wesentlicher Schritt in dem erfindungsgemaBen Verfahren ist die Partitionierung von Graphen in zeitlich unabhan- 
gige Teilgraphen. 

Der BegrifF "zeitliche Unabhangigkeit** wird damit definiert, daB die Daten, die zwischen zwei leilapplikationen Uber- 
tragen werden durch einen Speicher, gleich welcher Ausgestaltung (also auch mittels einfacher Register), entkoppelt 
werden. Die ist besonders an den Stellen eines Graphen moglich, an denen eine klare Schnittstelle mit einer begrenzten 
65 und mdglichst minimalen Menge von Signalen zwischen den beiden Teilapplikationen bestebt 

Die zeitliche Un abhangigkeit kann in groBen Graphen durch das gezielte Einfugen von klar definierten und mdglichste 
einfachen Schnittstellen zum Speichern von Daten in einen Zwiscbenspeicher herbeigefiihrt werden (vgl. Sn in Fig. 4). 
Schleifen weisen grundsatzhch eine starke zeitliche Unabhangigkeit auf, da sie lange Zeit uber einer bestimmten Menge 
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von (zumeist) in der Schleife lokalen Variablen arbeiten und nur beim Schleifeneinlritt und beim verlassen der Schleife 
eine Ubertragung der Operanden bzw. des Ergebnisses erfordern. 

Durch die zeitliche Unabhangigkeit wird erreicht, daB nach der vollslandigen Ausfuhrung einer Tfeilapplikation die 
nachfolgende Teilapplikation geladen werden kann, ohne daB irgendwelche weiieren Abhangigkeiten oderEinflusse auf- 
treten. Beim Speichern der Daten in den genannlen Speicher kann ein Signal (Trigger) generiert werden, das die uberge- 5 
ordneten Ladeeinheit zum Nachladen der nachsten Tfeilapplikation auffordert. Der Trigger kann bei der Verwendung von 
einfachen Registern als Speicher immer generiert werden, wenn das Register beschrieben wird. Bei der \ferwendung von 
Speichern, i. b. von solchen die nach dem HFOPrinzip arbeiten, ist die Generierung des Triggers von mehreren Bedin- 
gungen abhangig. 

Folgende Bedingungen konnen beispielsweise einzeln oder kombiniert ein Trigger erzeugen: 10 

- Ergebnis-Speicher voil 

- Operanden-Speicher leer 

- keine neuen Operanden 

- Beliebige Bedingung innerhalb der Teilapplikation, generiert durch z. B. 15 

- Vergleicher 

- Zahler. 

Eine Teilapplikation wird im folgenden auch Modul genannt, um die Verstandlichkeit aus Sicht der klassischen Pro- 
grammierung zu erhohen. Aus demselben Grund werden Signale im folgenden auch \&riablen genannt. Dabei unter- 20 
scheiden sich die Variablen in einem Punkt wesentlich von herk&mrnlichen Variablen: Jeder Variable ist ein Statussignal 
(Ready) zugeordnet, das anzeigt, ob die triable einen giilugen Wert besitzt. Wenn ein Signal einen gultigen (berechne- 
ten) Wert besitzt, ist das Statussignal Ready; wenn das Signal keinen gultigen Wert besitzt (Berechnung noch nicht ab- 
geschlossen), ist das Statussignal Not_Ready. Das Prinzip ist ausfuhrlich in der Patentanmeldung PACT02 beschrieben. 

25 

Das Prozessormodell 

Die in den folgenden Figuren gezeigten Graphen besitzen als Graphenknoten immer in Modul, wobei davon ausge- 
gangen wird, daB mehrere Module auf einen Zielbaustein abgebildet werden konnen. Das beiBt, obwohl alle Module zeit- 
lich voneinander unabhangig sind, wird nur bei nach den Modulen eine Umkonfiguration durchgefUhrt, bzw. ein Daten- 30 
speicher eingefugt, die mil einem vertikalen Strich und At markiert sind. Dieser Punkt wird Umkonfigurationszeitpunkt 
genannt. 

Das bedeutet zusammenfassend: 

1 . GroBe Module konnen an geeigneten Stellen partitioniert werden und in kleine zeitlich voneinander unabhangige 35 
Module zerlegt werden. 

2. Bei kleinen Modulen die sich gemeinsam auf einen Zielbaustein abgebildet werden konnen, wird auf die zeitli- 
che Unabhangigkeit verzichteL Dadurch werden Konfigurationsschritte eingespart und die Datenverarbeitung be- 
schleunigt. 

3. Die Umkonfigurationszeitpunkte werden entsprechend der Ressourcen der Zielbausteine positioniert Dadurch 40 
ist eine beliebige Skalierung der Graphenlange gegeben. 

In Fig. 4a sind einige grundlegenden Kgenschaften des erfindungsgemaBen Verfahrens dargestellt: 
Die Module des Types A sind zu einer Gruppe zusammengefaBt und besitzen am Ende einen bedingten Sprung, entweder 
nach Bl oder B2. An dieser Position (0401) ist ein Umkonfigurationspunkt eingefugt, da es sinnvoll ist die Zweige des 45 
bedingten Sprunges als jeweils eine Gruppe zu betrachten (Fall 1). Wiirden dagegen beide Zweige von B (Bl und B2) zu- 
satzlich zu A auf den Zielbaustein passen (Fall 2), ware es sinnvoll nur einen Umkonfigurationspunkt bei 0402 einzufu- 
gen, da dadurch die Zahl der Konfigurationen verringert wird und sich die \feraibeitungsgeschwindigkeit erhoht Beide 
Zweige (Bl und B2) springen bei 0402 nach C. 

Die Konfiguration der Zellen auf dem Zielbaustein ist in Fig. 4b schematisch dargestellt Dabei werden die Funktionen 50 
der einzelnen Graphenknoten auf die Zellen des Zielbausteins abgebildet Jeweils eine Zeile stellt eine Konfiguration dar. 
Die gestrichelten Pfeile bei einem Zeilenwechsel zeigen eine Umkonfiguration. Sn ist eine datenspeichernde Zelle, von 
beliebiger Ausgestaltung (Register, Speicher, etc.). Dabei ist S J ein Speicher, der Daten entgegennimmt und S n O ein 
Speicher der Daten ausgibt. Der Speicher S n ist fur gleiche n jeweils derselbe, I und O kennzeichnen die Datentransfer- 
richtung. 55 

Beide Falle des bedingten Sprunges (Fall 1, Fall 2) sind dargestellt 

Das Modeil in Fig. 4 entspricht einem DatenfluBmodell, jedoch mit der wesentlichen Erweiterung der Umkonfigura- 
tionspunkt und der damit erreichbaren Partitionierung des Graphen, wobei die zwischen den Partitionen ttbertragenen 
Daten zwischengespeichert werden. 

Im Modeil von Fig. 5a wird aus einer beliebigen Graphenmenge und -Konstellation (0501) selektiv ein Graph aus ei- 60 
ner Menge von Graphen B aufgerufen. Nach der Ausfuhrung von B gelangen die Daten nach 0501 zuriick. 

Wird in 0501 ein ausreichend groBer Sequencer (A) implementiert, ist mit dem Modeil ein den typischen Prozessoren 
sehr ahnliches Prinzip implementierbar. Dabei gelangen 

1. Daten in den Sequenzer A, die dieser als Befehle dekodiert und entsprechend dem "von Neumann"-Prinzip dar- 65 
auf reagiert; 

2. Daten in den Sequenzer A, die als Daten betrachtet werden und an ein fest konfiguriertes Rechenwerk C zur Be- 
rechnung weitergeleitet werden. 
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Ver Graph B stellt selektierbar cin besonderes Rechenwerke und/oder besondere Opcodes fur beslimmte Funktionen 
zur Verfugung und wird altemativ zur Beschleunigung von C verwendet. Beispielsweise kann Bl ein oplimierter Algo- 
rithmus zu Berechnung von Matrixmultiplikationen sein, wahrend B2 einen FIR-Filter und B3 eine Mustererkennung 
5 darstellt. Entsprechend eines Opcodes der von 0501 dekodi ert wird, wi rd der geeignete bzw. enlsprechende Graph B auf- 
gerufen. 

Fig- 5b schematisiert die Abbildung auf die einzelnen Zellen, wobei in 0502 der pipelineartige Rechenwerks-Charac- 
ter symbolisiert wird. 

Wahrend in den Umkonfigurationspunkten von Fig. 4 vorzugsweise groBere Speicher zum Zwischenspeichem der Da- 
10 ten eingefugt werden, ist eine einfache Synchronisation der Daten in den Umkonfigurationspunkten von Fig. 5 ausrei- 
chena\ da der Datenstrom vorzugsweise als ganzer durch den Graphen B lauft und der Graph B nicht weiter parti tioniert 
ist; dadurch ist das Zwischenspeicbern der Daten iiberfliissig. 

In Fig. 6a sind verschiedene Schleifen dargestellt. Schleifen konnen grundsatzlich auf drei Arten behandelt werden: 

15 1 . Hardware- Ansatz: Schleifen werden vollstandig ausgewalzt auf die Zielhardware abgebildet (0601a/b). Wie be- 

reits erlautert ist dies nur bei wenigen Schleifenarten moglich. 

2. DatenfluB-Ansatz: Lmerhalb der Datenflusses werden Schleifen iiber mehrere Zellen hinweg aufgebaut 
(0602a/b). Das Ende der Schleife wird auf den Schleifenanfang riickgekoppelt 

3. Sequenzer- Ansatz: Ein Sequenzer mit minimalem Befehlssatz fiihrt die Schleife aus (0603a/b). Dabei sind die 
20 Zellen der Zielbausteine so ausgestaltet, daB sie den entsprechenden Sequenzer beinhalten (vgl. Fig. 1 la/b). 

Durch eine geeignete Zerlegung von Schleifen kann deren Ausfuhrung ggf. optimiert werden: 

1. Unter Verwendung von Optimiemngsmethoden nach dem Stand der Technik laBt sich haufig der Schleifen- 
25 rumpf, also der wiederholt auszufuhrende Teil, dadurch optimieren, daB bestirnrnte Operationen aus der Schleife 

entfemt werden und vor oder hinter die Schleife gestellt werden (0604a/b). Dadurch wird die Menge der zu sequen- 
cenden Befehle erheblich reduziert. Die entfemten Operationen werden nur einmal vor bzw. nach Ausfuhrung der 
Schleife durchlaufen. 

2. Eine weitere Optimierungsmoglichkeit ist das Teilen von Schleifen in mehrere kleinere oder kiirzere Schleifen. 
30 Dabei findet die Teilung derart statt, daB mehrere parallele oder mehrere sequentielle (0605a/b) Schleifen entstehen. 

Fig. 7 verdeutlicht die Implementierung einer Rekursion. Dabei werden dieselben Ressourcen (0701) in Form von 
Zellen fur jede Rekursionsebene (1-3) verwendet. Die Ergebnisse einer jeden Rekursionsebene (1-3) werden beim Auf- 
bau (0711) in einen nacb dem Stack-Prinzip aufgebauten Speicher (0702) geschrieben. Gleichzeitig mit dem Abbau 
35 (0712) der Ebenen wird der Stack abgebaut. 

Hochsprachenbeispiele 
Ein Modul kann beispielsweise folgendermaBen deklariert werden: 

40 

nodule example! 

-T 

input (varl, var2 : tyi; var3 : ty a ) . 
45 output (real, res2 : ty 3 ) . 
begin 

• • * 

50 rogi©t^r <xegnamel> (resl). 

register <regname2> (res2) . 
55 tezainatee (res! 6 res2; 1). 

module kennzeichnet den Beginn eines Modules. 
60 input/output definiert die Ein-/Ausgangsvariablen mit den Typen ty D . 
begin . . . end markieren den Rumpf des Modules. 

register <regnamel/2> tibergibt das Ergebnis an den Output, wobei des Ergebnis in dem durch <regname l/2> spezifizier- 
ten Register zwischengespeichert wird. <regnamel/2> ist dabei eine globale Referenz auf ein bestimmtes Registen 
Als weitere Obergabemodi an den Output stehen beispielsweise folgende Speicherarten zur \ferfUgung: 
65 fifo <fifoname> t wobei die Daten an einen nach dem HPOPrinzip arbeitenden Speicher ubergeben werden. flfoname iBt 
dabei eine globale Referenz auf einen bestimmten, im FIFO-Modus arbeitenden Speicher. terminate® wird dabei um 
den Parameter bzw. das Signal "fifofuir erweitert, der/das anzeigt, daB der Speicher voll ist 

stack <stackname>, wobei die Daten an einen nach dem Stack-Prinzip arbeitenden Speicher ubergeben werden. stack- 
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name ist dabei eine globale Referenz auf einen bestimmten, im Slack-Modus arbcitenden Speicher. 
terminate® unterscheidet die Programmierung entsprechend des erfindungsgemaBen \ferfahrens von der herkomrnli- 
chen sequenliellen Programmierung. Der Befehl definiert das Abbruchkriterium des Modules. Die Ergebnisvariablen 
resl und res2 werden von terminated nicht mit ihrem latsachlichen Wert evaluiert, statt dessen wird nur die Gultigkeit 
der Variablen (also deren Statussignal) gepruft Sind beide Variablen giiltig, terminiert das Modul mit dem Wert 1. Das 5 
bedeutet, ein Signal mit dem Wert 1 wird an die Ubergeordneten Ladeeinheit weitergeleitet, woraufhin die ubergeordne- 
ten Ladeeinheit das nachfolgende Modul ladt. 

mod u l e example2 

10 

input {varl, var2 : ty 3 ; var3 : ty 2 ) . 
output (resl r ty«) . 

begin is 



register <regnamel> (varl, var2) . 
£ifo <fifonamel> (resl, 256). 



module main 

input (inl, in2 : ty 2 ; in3 : ty 2 ) . 

output (outl : ty«) . 

begin 

dafina <regnamel> : register (234) . 
define <xegname2> : register(26) . 
define <fifonamel> : fifo(4). 



25 



30 



35 



40 



taaoiaataS (fifofull«fifonamel>) ; 1). 
end. 

register wird in diesem Beispiel fiber input-Daten definiert Dabei ist <regnamel> derselbe wie in example 1. Dies be- 
wirkt, dafi das Register, das die output-Daten in ex ample 1 aufnimmt, die input-Daten fUr example2 zur \ferfugung stellt. 
fifo definiert einen FIFO-Speicher der Hefe 256 fiir die Ausgangsdaten resl. Das Full-Flag (fifofull) des FIFOSpeichers 
wird in terminate® als Abbruchkriterium verwendet. 



45 

(varl2, var72) = call examplel (inl, in2, in3) . 

(outl) = call exaraple2 (varl2, var72, var243). 
• • • 

signal (outl). 55 

taxminafceg (example2) . 

and. 

define definiert eine Schnittstelle fur Daten (Register; Speicher, etc.). Bei der Definition werden die erforderlichen Res- 60 
sourcen, sowie die Bezeichnung der Schnittstelle angegeben. Da die Ressourcen eindeutig angegeben werden und nur 
einmal verwendet werden k6nnen, ist die Definition global, & b. die Bezeichnung gilt fur das gesamte Programnx 
call ruft ein Modul als Unterprogramm auf. 

signal definiert ein Signal als Ausgangssignal, ohne daB eine Zwischenspeicherung verwendet wird. 
Durch terminate® (example2) wird das Modul main tenniniert, sobald das Unterprogramm example2 terminiert 65 
Durch die globale Deklaration "define . . ist es prinzipiell nicht mehr notwendig, die so definierten input/output Si- 
gnale in die Schnittstellen-Deklaration der Module aufzunehmen. Die entsprechend modifizierten Beispiel-Module war- 
den dann folgendermafien aussehen: 
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5 Die Zustandsinforrnationen des Prozessormodells 

Zur Bestimmung der Zustande innerhalb eines Graphen werden die Statusregister der einzelnen Zellen (PAEs) Uber 
ein zusatzlich zum Datenbus (0801) existierendes Status-Bussystem (0802) alien anderen Rechenwerken zur Verfugung 
gestellt (Fig. 8b). Das bedeutet, daB eine Zelle (PAE X) die Statusinformation einer anderen Zelle (PAE Y) evaluieren 
10 kann und demenlsprcchend die Daten verarbeitel. Um den Unterschied zu bestehenden Parallerechnersystemen zu ver- 
deutlichen, ist in Fig. 8a der Stand der Technik angegeben. Dabei ist ein Multiprozessorsystem gezeigt, dessen Prozes- 
soren iiber einen gemeinsamen Dalenbus (0803) miteinander verbiinden sind. Ein explizites Bussy stem fur den synchro- 
nen Austausch von Daten und Status existiert nicht. 

AbschbeBend soil angernerkt werden, daB je nach Aufgabe sowohl derDatenfluBgraph, als auch der KontroilfluBgraph 
15 entsprechend dem beschriebenen Verfahren behandelt werden kann. 

Erweiterungen in der Hardware gegenuberPACTO2 und PACT04 

Durch PACT02 und PACT04 ist der Stand der Technik in Bezug auf die Konfigurationseigenschaften von Zellen (PA- 
20 Es)definiert und veroffentlicht in DE 196 51 075 (PACT02) sowie in DE 196 54 846 (PACTO4). 
Dabei soil auf zwei Egenschaften eingegangen werden: 

1 . Einer PAE ist gemaB PACT02 ein Satz von Konfigurationsregistern zugeordnet, der eine Konfiguration beinhal- 
tet (Fig. 8a). 

25 2. Eine Gruppe von PAEs kann gemaB PACT04 auf einen Speicber zum Speichern oder Lesen von Daten zugreifen 

(Fig. 8b). 

Aufgabe ist es, 

30 a) ein Verfahren zu schaffen, das das Umkonfigurieren von. PAEs beschleunigt und zeitbch von der ubergeordneten 
Ladeeinheit entkoppelt, und 

b) das Verfahren so auszulegen, daB gleichzeitig die Moglichkeit geschaffen wind uber mehrere Konfigurationen zu 
Sequenzen. 

35 

Entkopplung der Konfigurationsregister 

Das Konfigurationsregister wird von der ubergeordneten Ladeeinheit (CT) entkoppelt (Fig. 9), indem ein Satz von 
mehreren Konfigurationsregistern (0901) verwendet wird. Immer genau eines der Konfigurationsregister bestimmt se- 
40 lektiv die Funktion dar PAE. Die Auswahl des aktiven Registers wird iiber einen Multiplexer (0902) durchgefuhrt In je- 
des der Konfigurationsregister kann die CT beliebig schreiben, sofern dieses nicht die aktuelle Konfiguration der PAE 
bestimmt. Welches Konfigurationsregister von 0902 selektiert wird kann durch verschiedene Quelien bestimmt werden: 

1. Ein beliebiges Status-Signal oder eine Gruppe beliebiger Status-Signale, die aber ein Bussystem (0802) an 0902 
45 gefuhrt werden (Fig. 9a). Die Status-Signale werden dabei von beliebigen PAEs generiert oder durch exteme An- 

schlOsse des Bausteins zur Verfiigung gestellt (vgl. Fig. 8). 

2. Das Status-Signal der PAE, die von 0901/0902 konfiguriert wird, dient zur Selektion (Fig. 9b). 

3. Ein von der ubergeordneten CT generiertes Signal dient zur Selektion (Fig. 9c). 

50 Dabei ist es moglich wahlweise die eingehenden Signale (0903, 0904, 0905) mittels eines Registers fur einen be- 
stimmten Zeitraum zu speichern. 

Durch den Einsatz mehrere Register wird die CT zeitlich entkoppelt Das bedeutet, die CT kann mehrere Konfigura- 
tionen "vorladen", ohne daB eine direkte zeitliche Abhangigkeit besteht 

Lediglich das selektierte Register in 0901 noch nicht geladen ist, wird mil der Konfiguration der PAE so lange gewar- 
55 tet, bis die CT das Register geladen hat. Um festzustellen, ob ein Register eine gOltige Information besitzt kann ein 
lid-Bif (0906) pro Register eingefiihrt werden, das von der CT gesetzt wird. 1st 0906 bei einem selektierten Register 
nicht gesetzt, wird Uber ein Signal die CT zum schnellstmogbchen Setzten des Registers aufgefordert. 

Das in Fig. 9 beschriebene Verfahren ist einfach zu einem Sequenzer erweiterbar (Fig. 10). Dazu wird ein Mikrokon- 
troller (1001) zur Ansteuerung der Selektionssignale des Multiplexers (0902) verwendeL Der Sequenzer bestimmt dabei 
60 abhangig von der aktuell selektierten Konfiguration (1002) und einer zusatzlichen Statusinformation (1003/1004) die 
nachste zu selektierende Konfiguration. Dabei kann die Statusinformation 

(a) der Status der Status-Signal der PAE, die von 0901/0902 konfiguriert wird sein (Fig. 10a). 

(b) ein beliebiges uber 0802 zugefuhrtes Statussignal sein (Fig. 10b). 
65 (c) eine Kombination aus (a) und (b) sein. 

Zum einf achen Verstandnis kann 0901 als ein Speicher betrachtet werden, wobei ttber 0902 ein Befehl von 1001 adres- 
siert wird. Die Adressierung ist dabei abhangig vom Befehl selbst und von einem Statusregister Insoweit entspricht der 
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Aufbau einer "von Neumann" Maschine, mil dem Unterschied, 

(a) der universeUen Einsetzbarkeit, also den Sequenzer nicht zu verwenden (vgL Fig. 9) 

(b) daB das Statussignal nicht von dem dem Sequenzer zugeordneten Rechenwerk (PAE) generiert werden muB, 
sondem von einem beliebigen anderen Rechenwerk stammen kann (vgl. Fig. 10b). 5 

Wichtig ist, daB der Sequenzer dabei Spriinge, insbesondere auch bedingte Spriinge, innerhalb von 0901 ausfuhren 
kann. 

Ein weiteres zusatzliches oder alternatives Verfahren (Fig. 1 1) zum Aufbau von Sequenzem innerhalb der genannten 
Bausteine ist die Verwendung der internen Datenspeicher (1101) zum Speichem der Konfi gurationsinformation fur eine l o 
PAE Dabei wird der Datenausgang eines Speichers auf einen Konfigurauonseingang einer R\E geschaltet (1102). Die 
Adresse (1103) fiir 1101 kann dabei von derselben PAE oder einer beb'ebigen anderen generiert werden. 

Bei diesem Verfahren ist der Sequenzer nicht fest implementiert, sondern wird durch eine PAE oder eine Gruppe von 
PAEs nachgebildet 



PatentansprOche 
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1. Verfahren zum Ausfuhren von Programmen auf einem Baustein mit ein- oder mehrdimensionaler ZeUstruktur, 
dadurch gekennzeichnet, dass Datenfluss- oder Kontrollflussgraphen in zeitlich getrennte Tfeilgraphen partitioniert 
werden und sequentiell auf den Baustein abgebildet und ausgefuhrt werden. 20 

2. Hardware mit entkoppeltem Konflgurationsregister. 
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